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(54) Verfahren zur Codierung/Decodierung eines Datenstroms 

(57) Das beschriebene Verfahren umfaftt die Ver- 
fahrensstufen einer Umsortierung sowie einer 
Komprimierung bzw. Dekomprimierung der Da- 
ten. Zur Umsortierung werden die Daten in 
einem Zwischenspeicher abgelegt und in an de- 
fer Ordnung dekomprimiert wieder ausgelesen. 

In der Stufe der Komprimierung bzw. Dekom- 
primierung konnen Datenblocke aus dem Da- 
te nstrom in einem zweiten Zwischenspeicher 
abgelegt und wieder ausgelesen werden, wobei 
die Daten auch in dem zweiten Zwischenspei- 
cher komprimiert abgelegt und beim Auslesen 
wieder dekomprimiert werden. 

Durch diese Maftnahmen werden der erfor- 
derliche Speicherbedarf fur den Zwischenspei- 
cher, die erforderliche Speicherbandbreite und 
die im Zwischenspeicher abzuspeichernde Da- 
tenrate minimiert. 
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Codier- und Decodierverfahren werden dazu verwendet, um die Datenrate zu minimieren und somit mog- 
lichst viele Daten mit einer geringen Anzahl von Kanalen zu ubertragen oder in moglichst wenig Speicher ab- 
legen zu konnen. 

Beispieisweise sind die Methoden zur Codierung und Decodierung von Bild- und Toninformation in den 
5 Standards "Joint Picture Expert Group" (JPEG) und "Motion Picture Expert Group" (MPEG) festgelegt. Gerate 
zur Durchfuhrung dieser Verfahren basieren zumeist auf digitalen Signal prozessoren (DSP). Auch Ein-Chip- 
Implementierungen sind bereits auf dem Markt erhaltlich. 

Stand der Technik 

10 

Ein Datenstrom besteht aus einer Abfolge von Elementen, deren Dateninhalte zu verschiedenen Gruppen 
zusammengefaftt werden konnen. Den Gruppen werden in regelmaftigen Abstanden neue Dateninhalte durch 
den Datenstrom zugewiesen. Die Gesamtheit der Gruppen bilden einen Datensatz. Bei der Verarbeitung von 
Datenstromen ist es zwischen den einzelnen Verfahrensschritten oftmals erforderlich, Daten blocke zwischen- 

15 zuspeichern. Aufierdem miissen strukturierte Datenstrome oftmals in eine andere Gruppierung umgeordnet 
werden. Der dafur erforderliche Speicherbedarf ist von der maximalen Datenmenge abhangig, die pro Zeit- 
einheit parallel abgespeichert werden mud. 

Der Speicherbedarf kann verringert werden, indem Adressierungsmethoden verwendet werden, bei denen 
z.B. freie Speicherplatze zwischen blockweise abgelegten Daten ausgenutzt werden. Moglich ist auch eine 

20 virtuelle Adressierung, bei der eine logische Adresse, die zur Position des Elementes im Segment proportional 
ist, durch eine Transformationsfunktion in eine physikalische Adresse umgerechnet wird. Bei grolien Daten- 
mengen, wie sie z.B. bei der digitalen Bildverarbeitung anfallen, ist der resultierende Speicherbedarf dennoch 
zu hoch. Problematisch bleibt aufierdem die unverandert hohe Datenrate, mit der die Informationen im physi- 
kalischem Speicher abgelegt werden. 

25 Am Beispiel der digitalen Bildverarbeitung nach dem MPEG-Verfahren sei die Problematik der Zwischen- 

speicherung und Umformatierung naher erlautert: 

Naturliche Bildsequenzen haben drei Eigenschaften, die fur die Kodierung ausgenutzt werden konnen. 
Zunachst sind aufeinanderfolgende Bilder einer Bildsequenz ahnlich. Anderungen von Bild zu Bild sind dabei 
selten auf neue Bildinhalte zuruckzufuhren, als vorwiegend auf die Bewegung von Objekten. Desweiteren be- 

30 stehen naturliche Bilder in erster Naherung aus Flachen und Kanten. Dabei nehmen die Flachen den Hauptteil 
des Bildbereichs ein. Sie sind charakterisiert durch allmahliche Farb- und Helligkeitsubergange. Daher sind 
benachbarte Pixel innerhalb eines Bildes oft ahnlich. Schliefilich kommen innerhalb naturlicher Bilder nicht 
alle Graustufen gleich hauf ig vor. Ein mittlerer Grauwert wird hauf iger auftreten als schwarz und weili. 

Diese drei Effekte beschreiben die Ahnlichkeit des Signals mit sich selber, namlich die Ahnlichkeit aufein- 

35 anderfolgender Bilder, die Ahnlichkeit ortlich benachbarter Bildpunkte und die Ahnlichkeit von Hauf igkeitsver- 
teilungen der Grauwerte verschiedener Bilder. Diese Redundanzen konnen zur Kompression ausgenutzt wer- 
den, indem zeitliche Redundanzen aufeinanderfolgender Bilder durch eine bewegungskompensierte DPCM- 
Schleife (Differential Pulse Code Modulation) und raumliche Redundanzen und Irrelevanzen innerhalb eines 
Bildes durch eine DCT (Diskrete Cosinus-Transformation) und VLC-Techniken (Variable Length Coding, be- 

40 stehend aus Run-Length- und Huffmann-Codierung) aufgelost werden. Diese Techniken zur Videokompres- 
sion werden Hybridcodierung genannt. Sie sind bereits aus Videokonferenz- und Zuspielungs-Codecs, den 
Normen CCITT bzw. ITU-T, H.261 bzw. CMTT/2, und aus dem JPEG-Verfahren hinreichend bekannt und er- 
probt. 

Die Datenkompression wird in einem MPEG-Encoder durchgef uhrt. In einer ersten Stufe werden die digi- 
ts talen Videodaten zuerst aus der zeilenweisen Bilddarstellung in eine Abfolge von 8x8-Blockmatritzen umsor- 
tiert (Frame- Reordering), da ein vollstandiges, in einer zweidimensionalen Matrix reprasentierbares Fernseh- 
bild derart ubertragen wird, daft die Bildpunkte zeilenweise zusammengefafit sind und die Zeilen zeitlich auf- 
einanderfolgen. Die Bildpunkte entsprechen dabei den Elementen eines Datenstroms, die Gesamtheit der Ele- 
mente in einer Zeile einer Gruppe, und das Bild einem Datensatz. Das im MPEG-Standard beschriebene 
so blockorientierte Codierungsverfahren sieht vor, dall die ublicherweise zeilenweise organisiert vorliegenden 
Bilder in der Reihenfolge umsortiert, in Blocke unterteilt, und schliefJIich in Gruppen von Blocken, sogenahnten 
Makroblocken, verarbeitet werden. Jeder dieser Blocke besteht dabei aus 8 Blockzeilen mit je 8 Bildpunkten. 
Die Gruppen werden in eine andere Gruppierung umgeformt, indem ein zeilenweise dargestelltes Bild in nicht- 
uberlappende Bldcke fester Spalten- und Zeilenanzahl aufgeteilt wird. Dabei re prase ntieren die Blocke jeweils 
55 einen Bildausschnitt. Aufierdem wird die zeitliche Aufeinanderfolge der Datensatze - Bilder - ebenfalls gean- 
dert. 

Fur diese Umformatierung ist ein Bildspeicher vorgesehen, der derart adressiert werden mufi, daft auf die 
Gruppenelemente gezieltzugegriffen werden kann. Die Gruppen mussen also eine regelmaftige Struktur auf- 
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weisen. Die Umordnung der Datensatze erfordert hingegen keine Struktur mehr, da auf die Blocke als Ge- 
samtheit zugegriffen wird. Wenn die insgesamt verfugbare Speichergrolie ausreichend ist, konnen die einzel- 
nen Blocklangen variabel sein. 

DerSpeicherbedarf fur die Zeilen/Block-Umformatierung ergibt sich bei blockorientierten Bildcodierungs- 

5 verfahren fur Blocke mit n Zeilen zu n-1 Zeilen. Hinzu kommt der Speicherplatz fur die Anderung der Bildrei- 
henfolge. DieserSpeicherbedarf ergibt sich ausder Anzahl derzwischenzuspeichernden Bilder b und der Bild- 
grolie. Hinzu kommt, dad bei mehrstufigen Umformatierungen mehrere Speicherbanke und Adreligeneratoren 
erforderlich sind. AuRerdem mussen die Informationen mehrfach gelesen und geschrieben werden. 

Eine zweite Stufe dient der Datenkompression durch die erwahnten Hybridcodierungsverfahren. Es wird 

10 ein Bildspeicher benotigt, in dem vorhergehende Bilder zwischengespeichert und zur Bewegungskompensa- 
tion des jeweils aktuellen Bildes verwendet werden. Der Speicher ist ublicherweise hinter den Rechenwerken 
zur Durchf uhrung einer Diskreten-Cosinus-Transformation (DCT) und Quantisierung (Q), sowie der inversen 
Quantisierung (Q- 1 ) und inversen DCT (DCT* 1 ) angeordnet. Die Bilddaten werden vor dem Speichern trans- 
formiert und rucktransformiert, damit die Codierungsfehler bei der Bewegungsschatzung kompensiert werden 

is konnen. 

Herkommlicherweise werden in beiden Speichern eines MPEG-Encoders unkomprimierte Bilder abge- 
speichert. Die Speicher mussen somit retativ groli ausgelegt sein. Je nach zu verarbeitenden Bildformaten und 
Normen besitzen die Speicher fur die erste und zweite Stufe Groften zwischen ca. 300 kByte fur 1/4 eines TV- 
Bildes und mehr als 4 MByte fur ein hochaufgelostes TV-Bild (HDTV-Bild). 

20 Die Datendekompression wird in einem MPEG-Decoder durchgefuhrt. Hierzu werden die gemaR dem 

MPEG-Standard umgeordneten und kodierten Bilddaten eines Bildes von einem MPEG-Decoder eingelesen. 
In einer ersten Stufe werden die prinzipiellen Werteangaben und Bildparameter aus dem Datenstrom ausge- 
lesen (Header-Detektion) und die mit variabler Codewortlange codierten Daten in dem Variable-Length-De- 
coder (VLD) decodiert. Dabei werden die Bilddaten uber eine inverse Zig-Zag-Funktion wieder in eine Block- 

25 anordnung umsortiert Hierzu dient ein erster Bildspeicher. Der umsortierte und VLD-decodierte Datenstrom 
ist blockweise aufgeteilt und wird in einer zweiten Stufe mittels Dequantizierung (Q~ 1 ) und zweidimensionalen 
inversen diskreten Cosinustransformation (DCT- 1 ) weiter decodiert. Anschlieflend wird die Bewegungskom- 
pensation ruckgangig gemacht. Hierzu dient die entsprechende Stufe mit einem Bildspeicher, der auch als Puf- 
fer fur die Bildausgabe verwendet werden kann. 

30 Das erste decodierbare Bild einer Sequenz ist ein ganzlich ohne Bewegungskompensation "intra"- 

codiertes Bild (l-Picture). Dieses Bild wird als Resultat der DCT 1 direkt in den Speicher geschrieben. Von dort 
kann es fur das nachste decodierte Bild, zum Beispiel ein aus vorangegangenen Bildern vorhergesagtes 
"pradiktives" Bild (P-Picture) oder ein aus vorangegangenen und nachfolgenden Bildern "bidirektional 
pradiktives" Bild (B-Picture), zur Bewegungskompensation herangezogen werden. Diedecodierten P-Pictures 

35 werden zur Bewegungskompensation von B-Pictures ebenfalls zwischengespeichert, falls diese in der Se- 
quenz vorkommen. 

In der Stufe zur Bewegungsdekompensation werden die Bilddaten, wenn es sich um P- oder B- Bilder han- 
delt, passend mit den im Speicher liegenden unkomprimierten Bilddaten eines vorhergehenden I- oder P-Bil- 
des oder zweier vorhergehender B-Bilder verrechnet. Die l-Bilder werden ohne Informationen aus dem Spei- 

40 chsr direkt dskcmpensisrt Der dsKcm ps nslsrts Daisnstrcm entsprichi wieder sinsrrt dsccdierter! ncrrrislsn 
Bild mit Luminanz- und Chrominanzwerten laut CCIR Norm. 

Der Bildspeicher in der zweiten Stufe wird normalerweise mit Hilfe der VLD-decodierten Bewegungsvek- 
toren adressiert. Dabei wird durch diese Vektoren makroblockweise eine Verschiebungsposition eines Makro- 
blockes des aktuellen Bildes zur Position eines Makroblockes aus einem vorhergehenden Bild angegeben. 

45 Auch bei dem Decoder ergibt sich fur den ersten Bildspeicher zum Umsortieren und Puffern des Daten- 

stroms, dad auf die Gruppenelemente gezielt zugegriffen werden mu&. Auderdem ist fur die Bildspeicher der 
ersten und zweiten Stufe ein hoher Speicherbedarf erforderlich. 

Fur die Mehrkanaltonubertragung von Audiodaten werden diese in einem MPEG-Coder komprimiert. In 
einer ersten Stufe werden die Kanale des Datenstroms teilbandgef iitert. Die dadurch entstehenden Frequenz- 

so bander werden quantisiert und zur Bildung zweier kompatibler Stereokanale matrixiert. In einer zweiten Stufe 
erfolgt die Codierung der Datenstrome. Anschlie&end werden die Daten derart formatiert, dafi sie sequentiell 
als MPEG-Datenstrom auf einem Kanal ubertragen werden konnen. Hierzu werden sie in Pakete aufgeteilt 
und mit Steuerinformationen versehen. 

Fur die Ausfuhrung dieser Codierungsverfahren sind Zwischenspeicher erforderlich. Im Gegensatz zum 

55 Videoencoder besteht das Speicherproblem nicht so sehr in der Speichergro&e, als vielmehr in der Speicher- 
bandbreite. Es kann namlich dazu kommen, dafi die Daten rate eines Bilddatenstroms zu groft ist. Dann wird 
die Speicherzugriffszeit uberstiegen. Abhilfe schafft dann die kostenintensive Verwendung von schnelleren 
Speicherbausteinen oder eine Minimierung der Datenrate. 
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Die Dekompression von Audiodatenstromen erfolgt in einem Audiodecoder. Dabei wird in einer ersten St Li- 
fe der Datenstrom deformatiert. Entsprechend der Videodecodierung werden die Steuerdaten aus dem Kopf 
einer Sequenz gelesen (Header-Detection) und diese zusammen mit den codierten Abtastwerten der Deco- 
dierung zugefuhrt. Dabei werden die Daten wiederin Teil bander zuriickgewandelt. In einer weiteren Stufe wer- 
5 den die Kanale durch eine Dematrixierung wieder zuruckgewonnen und Teilbandgefiltert. Das Ergebnis sind 
Kanale von im Zeitbereich vorliegenden pulscodemodulierten Audiodaten (PCM-Daten). 

Fur die Dekompression ist ebenfalls Speichererforderlich, der aus Platzgrunden ublicherweisefurdie ver- 
schiedenen Stufen gemeinsam genutzt wird. Auch hierbei treten neben Problemen der SpeichergroBe vor al- 
lem Konflikte aufgrund zu geringer Speicherbandbreite auf. 

10 

Die Erfindung 

Die Erfindung geht aus von einem Verfahren zur Codierung/Decodierung eines Datenstroms, welches die 
Verfahrensstufen einer Umsortierung sowie einer Komprimierung bzw. Dekomprimierung der Daten umfaBt, 

15 wobei die Daten zur Umsortierung in einem Zwischenspeicher abgelegt und in anderer Ordnung aus dem Zwi- 
schenspeicher ausgelesen werden. Aufgabe der Erfindung ist es, dieses Verfahren dahin zu verbessern, daB 
der erforderliche Speicherbedarf fur den Zwischenspeicher, die erforderliche Speicherbandbreite und die im 
Zwischenspeicher abzuspeichernde Datenrate minimiert werden kann, also die Umsortierung der Datenstro- 
me resourcesparend und zeitoptimiert durchf uhrbar ist. Diese Aufgabe wird erf indungsgemaB dadurch gelost, 

20 daft die Daten komprimiert in dem Zwischenspeicher abgelegt und beim Auslesen wieder dekomprimiert wer- 
den. 

Wenn bei dem Verfahren zur Codierung/Decodierung des Datenstroms in der Stufe der Komprimierung 
bzw. Dekomprimierung Datenblocke aus dem Datenstrom in einem zweiten Zwischenspeicher abgelegt und 
wieder ausgelesen werden sollen, ist in weiterem Verfolg des Erf indungsgedankens vorgesehen, daB die Da- 

25 ten komprimiert in dem zweiten Zwischenspeicher abgelegt und beim Auslesen wieder dekomprimiert werden. 

Durch die Kompression wird daszwischenzuspeichernde Datenvolumen erheblich verringert. Dies hat we- 
sentliche weitere Vorteile zur Folge. So wirkt sich dies insbesondere bei der Videoverarbeitung vorteilhaft da- 
hingehend aus, dad nunmehr wesentlich kleinere Speicher eingesetzt werden konnen. Bei der Audioverarbei- 
tung kommt in erster Linie zum Tragen, daB sich die Anzahl der Speicherzugriffe und damit die erforderliche 

30 Speicherbandbreite verringert. In jedem Fall wird eine erheblich schnellere Zwischenspeicherung der Daten- 
strome erreicht. AuBerdem ist der Hard wareAuf wand fur die Speicher deutlich kleiner als bisher, und es ist 
lediglich ein geringer zusatzlicher Gatteraufwand erforderlich. 

Bei der Umsortierung von komprimierten Datensatzen wird der Zugriff auf die variablen Gruppen eines 
Datensatzes durch das Kompressionsverfahren bestimmt. Bevorzugt wird ein Kompressionsverfahren, bei 

35 dem die Strukturen und GroBen einzelner Datengruppen, sowie der Ort der Zwischenspeicherung unabhangig 
vom Dateninhalt definiert und der Kompressionsfaktor einzelner Datengruppen festgelegt ist, also einzelne 
Gruppen mitfestem Kompressionsfaktor komprimiert werden. Wenn dabei die Strukturen und GroBen einzel- 
ner Datengruppen und der physikalische Ort der Zwischenspeicherung auf dem Speichermedium unabhangig 
vom Dateninhalt ist, kann auf die komprimierten Elemente der Datengruppen gezielt zugegriffen werden, und 

40 dann lalit sich der Datenstrom wie ein unkomprimierter Datenstrom in einem Schritt umformatieren. 

Kompressionsverfahren, bei denen die Datenlangen variiert werden, sind fur die Zwischenspeicherung in 
der Stufe der Umsortierung weniger geeignet, weil dann die Umformatierung der Gruppierung vor der Kom- 
pression stattfinden muB. Ein direkter Zugriff auf einzelne Gruppen ist dann nicht mehr moglich, ohnezusatz- 
liche AdreBinformationen abzuspeichern. Dies hat zur Folge, dad mit solchen Kompressionsverfahren der 

45 Speicherbedarf und die Zugriffsrate fur die Umformatierung nicht so stark verringert werden kann. 

Vorzugsweise wird bei dem ersten Zwischenspeicher oder bei beiden Zwischenspeichern zur Kompres- 
sion und Dekompression eine Differential-Puls-Code-Modulation (DPCM) verwendet. Dies bietet den Vorteil 
des geringeren Rechenaufwandes und einer geringeren Anzahl erforderlicher Gatter. Bei der Bildverarbeitung 
kann aufgrund dervorhandenen AhnlichkeitderZeilenstruktur in Blocken und Bildern unter Verwendung einer 

so hierarchischen Adressierung auch ein blockweise arbeitender zweidimensionaler Pradiktorfur die DPCM ein- 
gesetzt werden. Damit kann der Kompressionsfaktor und die Qualitat der ubertragenen Daten verbessert wer- 
den. 

Bei einer weiteren Ausf uhrungsform, die insbesondere fur den zweiten Zwischenspeicher geeignet ist, wird 
die Kompression derart durchgefuhrt, daB die Daten mit Hilfe einer zweidimensionalen DCT, einer Quantisie- 
55 rungsstufe (Q) und einer VLC unabhangig von der Bildkomplexitat auf eine feste GroBe komprimiert werden. 
Dies hat den Vorteil, daB der zur Verf ugung zu stellende Speicherbedarf vorhersagbar ist. Zum Auslesen der 
Daten erfolgt die Dekompression mit den inversen Verfahren. 

Indem die Quantisierungsstufe durch eine Quantisierungssteuerung (Rate-Control) gesteuert wird, kann 
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der Quantisierungsfaktor blockweise nachgeregelt werden. Dadurch wird der Bildspeicher immer voll ausge- 
nutzt. Es ist moglich, ein Optimum zwischen Bildquaiitat und Speicherbedarf zu erreichen. 

Zeichnungen 

5 

Anhand der Zeichnungen sind Ausfuhrungsbeispiele der Erfindung beschrieben. Dabei sind handelsubli- 
che Bausteine mit ihren ublichen Kurzbezeichnungen und alle anderen Schaltungsteile mit Ziffern bezeichnet. 
Es zeigen: 

Fig. 1: MPEG - Encoder mit Bildspeichern fur die Umsortierung und die Bewegungskompensation 

10 Fig. 2: Verfahren zur Speicherminimierung 

Fig. 3: MPEG - Decoder mit Bildspeichern fur die Umsortierung und die Bewegungskompensation 

Fig. 4: Spezieller Huffmannkoder zur Durchf uhrung einer VLC 
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Ausfuhrungsbeispiele 



Das Verfahren kann bei einer Vielzahl von Datenverarbeitungseinrichtungen mit alien denkbaren 
Kompressionsaigorlthmen eingesetzt werden. 

Die erforderliche Speicherkapazitat wird dadurch verkleinert, dafl die Daten vor dem Speichern kompri- 
miert und beim Auslesen wieder dekomprimiert werden. Die resultierende Speicherkapazitat berechnet sich 
20 in Abhangigkeit von dem Kompressionsfaktor k zu: Spk = Spn / k 
mit 

Spk : Speicherkapazitat fur komprimierte Datenmenge 
Spn : Speicherkapazitat fur unkomprimierte Datenmenge 
k : Kompressionsfaktor 

25 Der Kompressionsfaktor k ist abhangig von dem gewahlten Kompressionsverfahren und der gewunschten 

Qualitat der zu speichernden Daten. 

Die Erfindung wird nun am Beispiel der Bilddatenverarbeitung nach dem MPEG- Verfahren naher erlautert. 
In Fig. 1 ist der Aufbau eines herkommlichen MPEG-Decoders dargestellt. Die unkomprimierten Daten 1 wer- 
den in einem Rechenwerk 2 (Frame-Reordering) umgeordnet, wobei ein Bildspeicher 3 zum Schreiben 4 und 

30 Lesen 5 genutzt wird. Der Speicher wird durch eine Steuereinheit mittels Controlsignale 6 gesteuert. Der nach- 
folgende Bewegungsschatzer 7 greift auf den zweiten Bildspeicher 8 zu. Dort sind die unkomprimierten Daten 
vorhergehender Bilder abgelegt. AnschlieSend folgt die Kompression mittels DCT und Quantisierung Q. Die 
Daten werden dann zum einen einer Variable-Length-Codierung (VLC) unterzogen und zur Ausgabe in einem 
Zwischenspeicher 9 gepuffert und als komprimierter Datenstrom 10 ausgegeben. Zum anderen wird eine in- 

35 verse Quantisierung und eine inverse DCT durchgef uhrt und die Daten werden in dem Bildspeicher 8 abgelegt. 
Durch eine Quantisierungssteuerung 11 (Rate-Control) kann der Quantisierungsfaktor blockweise nachgere- 
gelt werden. 

Das erf indungsgema&e Verfahren kann in die erste Stufe zur Umsortierung und die zweite Stufe zur Be- 
wegungskompensation eingef ugt werden. Die Einsatzbereiche der Erfindung im Encoder sind durch ein ge- 
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Die Umsortierung kann dann in einem Schritt durchgef uhrt werden, wenn ein fester Kompressionsfaktor 
fur einzelne Gruppen unabhangig vom Dateninhalt vorgegeben wird. Dies ist durch den Einsatz geeigneter 
Quellencodierungsverfahren erreichbar. Ein mogliches Verfahren ist die verlustbehaftete DPCM mit fester Co- 
dewortlange, wie sie in Fig. 2 dargestellt ist, oder eine entsprechende Transformationscodierung. 

45 in Fig. 2 ist ein Block 1 2 zur Speicherminimierung dargestellt. Anstelle des unkomprimierten Abspeicherns 

der Original-Bilddaten in den Speicher werden diese einer DPCM unterzogen. Hierfur wird der Datenstrom 4 
mit Daten, die durch einen Pradiktor 13 vorhergesagt sind, verrechnet und quantisiert (Q). Anschlieftend wird 
der Datenstrom mit einem Huffmann-Verfahren 14 codiert und in den Speicher 15 geschrieben. Zum Auslesen 
wird der Datenstrom in einem Huffman n-Decoder 16 decodiert und mit den, mittels Pradiktor 17 vorhergesag- 

50 ten Werten verrechnet. 

Dieses Verfahren der Codierung und Decodierung mittels DPCM hat den Vorteil, da(i der Kompressions- 
faktor festgelegt werden und somit auf die Daten im Speicher gezielt zugegri.ffen werden kann. Aulierdem ist 
der Gatteraufwand zur Implementation in einem Halbleiterbaustein recht gering. 

Zur separaten Blockzeilencodierung /-decodierung zur Umsortierung ist erfahrungsgemaU ein Kompres- 

55 sionsfaktor von zwei einsetzbar, ohne daR wesentliche Beeintrachtigungen der Bildquaiitat auftreten. Durch 
eine hierarchisch strukturierte Adressierung kann direkt auf jede Blockzeile zugegriffen werden. Damit konnen 
alle Umformatierungsoperationen nach dem Einschreiben in den Speicher 15, der als RAM mit wahlfreiem Zu- 
griff ausgefuhrt sein sollte, in einem Schritt durch direkte Adressierung der Blockzeilen beim Auslesen durch- 
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gefuhrt werden. 

Da jede Gruppe ohne Bezug auf benachbarte Gruppen komprimiert wurde, kann anschlieliend das Signal 
wieder separat dekomprimiert werden. 

Ein anderes Ausf uhrungsbeispiel der Erf indung ist in Fig. 3 dargestellt. Der Datenstrom 4 wird einer zwei- 
5 dimensionalen diskreten Cosinustransformation (DCT) unterzogen und anschlieliend mittels einer Quantisie- 
rungsstufe (Q) quantisiert. Die quantisierten Daten 18 werden in einer besonderen Huffmannkodierung (VLC), 
die in Fig. 4 dargestellt ist, komprimiert. Der komprimierte Datenstrom 19 wird dann im Speicher 15 abgelegt. 
Die Steuerung derQuantisierung ubernimmteine Quantisierungssteuerung 20 (Rate- Control). Beim Auslesen 
der komprimierten Daten werden diese Schritte dann mittels der entsprechenden inversen Operationen riick- 
10 gangig gemacht (VLD, Q-\ DCT" 1 ). Dieses Verfahren, das dem JPEG-Standard ahnlich ist, weist dabei fol- 
gende Besonderheiten auf: 

a) Bilder werden nur Intra-codiert. 

b) Bilder werden unabhangig von der Bildkomplexitat auf eine feste Grofie komprimiert. 

c) Die Quantisierungssteuerung 20 arbeitet pradiktiv, d.h. sie beriicksichtigt wahrend der Bildkompression 
15 auch die noch zu erwartenden Datenmengen des noch nicht bearbeiteten Bitrestes. 

d) Die Huffman n-Tabellen werden in Abhangigkeit von der Kompressionsrate, die wiederum durch den An- 
wendungsfall bestimmt ist, speziell angepalit. 

e) Falls ein unkodierter Block (8x8 Pixel) weniger Daten umfalit als ein kodierter, wird er uncodiert abge- 
speichert. 

20 Fur die DCT kann eine beliebige Architektur verwendet werden, sofern sie die Anforderungen an die Ge- 

nauigkeit gemaR des zugrundeliegenden Standards (z.B. MPEG oder H.261) erfullt 

Die Quantisierung arbeitet in ihren Grundzugen analog zu JPEG und besitzt auch denselben zweistuf igen 
Aufbau. Die Quantisierungssteuerung 20 regelt den Quantisierungsfaktor blockweise nach. Dies geschieht in 
Abhangigkeit des Fullstands des Bildspeichers und der zu erwartenden Komplexitat des Bildes. 

25 Ein spezieller Huffmannkoder ist in Fig. 4 dargestellt. Zuerst werden die quantisierten Daten im Zigzag- 

Scan aus einem ersten RAM-Speicher 21 gelesen. Der erste Wert, die Gleichkomponente (DC) im Frequenz- 
bereich, wird uncodiert in den Ausgangsspeicher 22 geschrieben. Die nachfolgenden Wechselkomponenten 
(AC-Werte) werden analog zum MPEG-Standard nach dem Run-Length-Verfahren kodiert. Die dadurch ent- 
standenen Wertepaare werden dann mittels einer Huffmann-Tabelle in einen Bitcode variabler Lange trans- 

30 formiert. Hierzu dient ein Huffmann-Coder 23, ein Multiplexer 24 und ein Registerspeicher 25. Am Uberlauf 
des Ausgangsspeichers 26 erkennt man, ob der kodierte Block mehr Daten enthalt als der uncodierte. Dann 
wird der Block zwar DCT-transformiert aber nicht komprimiert ausgegeben. 

Am Ausgang des VLC erscheint also ein Bitstrom mit kodiertem bzw. teilweise auch uncodierten Daten, 
die entsprechend der Wortbreite des Speichers mit einem Multiplexer 27 parallelisiert und in dem Register- 

35 speicher 22 abgespeichert werden. In einem weiteren Speicher muR fur jeden Block noch ein Flag gesetzt wer- 
den, der kennzeichnet, ob es sich um einen uncodierten oder kodierten Block handelt. Auderdem mu(i der zum 
Block gehdrige Quantisierungsfaktor abgelegt werden. 

Durch Algorithmen, die abhangig vom Anwendungsfall sind, kann sichergestellt werden, daft der Bildspei- 
cher immervoll ausgenutzt wird, so da&sich ein Optimum zwischen Bildqualitat und Speicherbedarf einstellt. 

40 Die Quantisierungssteuerung 20 bestimmt zusammen mit der Quantisierung (Q) und der Huffmann-Codierung 
(VLC) den Kompressionsfaktor. 

Die Decodierung der Bildspeicherdaten nach dem inversen Verfahren erfolgt analog zur VLC. Dabei muli 
das Flag ausgewertet werden, welches der Kennzeichnung dient, ob es sich um einen codierten oder unco- 
dierten Block handeit. 

45 Die Dequantisierung arbeitet analog zur Quantisierung. Es werden die 12 bitbreiten Eingangsdatenfurdie 

inverse DCT erzeugt. 

Zur inversen diskrete Cosinustransformation (DCT- 1 ) kann jede Hardware verwendet werden, sofern die 
Anforderungen des jeweiligen Standards unterstiitzt werden. 

Die Einsatz der Erf indung wird ferner an einem MPEG-Videodecoder in Fig. 5 dargestellt: 
50 Dabei kann das Verfahren zum einen zur Umsortierung des Datenstroms nach der Header-Detektion 28 

verwendet werden. Der hierfur ublicherweise verwendete Zwischenspeicher 29 kann durch das 
erfindungsgemape Verfahren 12 ersetzt werden. 

Vorteilhaf t kann das Verfahren zur Bewegungskompensation eingesetzt werden. Die mittels VLD, Q~ 1 und 
DCT- 1 decodierten Bilddaten werden, wenn es sich um I- oder P-Bilder handelt, nach dem in Fig. 3 gezeigten 
55 Verfahren komprimiert und in den Bildspeicher 30 geschrieben. Dort stehen sie fur ein zukunftiges zu deco- 
dierendes P- bzw. B- Bild zur Verfugung. Auf diese Weise stehen im Bildspeicher immer die letzten beiden P- 
Bilder bzw. ein I- und ein P-Bild komprimiert zur Verfugung. Uber das inverse Verfahren werden die Daten 
wieder dekomprimiert und der Dekompensationsstufe 31 zugefuhrt. Die B-Bilder werden von der Dekompen- 




6 



EP 0 687 111 A2 



sationsstufe 31 direkt uber einen Multiplexer 32 an die Ausgabeeinheit weitergereicht und nicht zwischenge- 
speichert. 

Der Speicher 30 ist in zwei Teilbereiche mit je zwei Banken aufgeteilt. Die Speicheradressen werden durch 
die Vektoren des VLD generiert und in einem AdreRspeicher 33 abgelegt 
s Die nachfolgende Einheit mud dazu in der Lage sein, die Bilddaten blockweise und nicht zeilenweise, wie 

bei Monitoren erforderlich, entgegenzunehmen. 

Der abgeschatzte Hardwareaufwand mit und ohne Speicherminimierung ist im folgenden im Vergleich 
stellvertretend fur einen MPEG - Decoder, fur zwei CCIR601 Norm - Bilder, bei 4:2:0 Chromaformataufgefuhrt: 

Wahlt man fur hochste Bildqualitat einen Kompressionsfaktor k=3 fur die Bildspeicherdaten, so werden 
10 uber 1/50 s gemittelt nur 44/3 MBytes ubertragen. Dies entspricht einer Bitrate von 14.7 MByte/s. Die dafur 
erforderliche Speich erg rode des Bildspeichers betragt dann: 720 Bildspalten x 288 Bildzeilen x (8 + 4 Bit pro 
Pixel) x 4 Speicherbanke (2 I- und 2 P-Bilder) / k = ca. 10/k MBit = ca. 3.3 MBit. 

Furjeden Block mussen die Startadressen zusammen mitdem Quantisierungsfaktorund dem Flag fur ko- 
dierte oder uncodierte Daten in einem Adrefispeicher abgelegt werden. Unter den oben gemachten Voraus- 
15 setzungen ergibt sich eine Wortbreite der Adresse fur den Bildspeicher von 26 Bit pro Block. 

Die Anzahl der benotigten Eintrage des Adrelispeichers richtet sich nach der Blockanzahl, der Blockgrd&e 
und der Norm des Bildes: 720 Bildspalten / 8 (horizontale BlockgrofJe) x 288 Bildzeilen / 8 (vertikale 
BiockgroSe) x 1 ,5 (Luminanz und Chrominanz) = 4860 Blocke pro Speicherbank. Daraus folgt eine Gesamtzahl 
von 19440 Eintragen & 26 Bit, d.h. ca. 505 KBitfur den Adrelispeicher. 
20 Fur die spezielfe Ansteuerung des Bildspeichers in einem MPEG - Decoder wird ein Mehraufwand an Hard- 

ware von einer zweidimensionalen DCT, einem Quantisierer (Q) und einem Huffmannkoder (VLC) inkl. Quan- 
tisierungssteuerung 20 erforderlich. Zum Auslesen ausdem Bildspeicher werden proTeilspeicher eine inverse 
DCT (DCT- 1 ), ein Dequantisierer (CH) und ein Huffmann-Decoder (VLD) benotigt. 



25 


zu implementierende 


Speicherminimierung 




Hardware 


mit 


ohne 




2 DCT-1 (60 MHz) 


24000 Gatter 


0 Gatter 


30 


2Q- 1 


10000 Gatter 


0 Gatter 




2 VLD 


10000 Gatter 


0 Gatter 




1 VLC 


8000 Gatter 


0 Gatter 


35 


1 Q 


5000 Gatter 


0 Gatter 




1 DCT (16 MHz) 


8000 Gatter 


0 Gatter 




1 Rate-Control 


5000 Gatter 


0 Gatter 


40 


AdrefVspeicher 


505 KBit 


0 Bit 




Bildspeicher 


3.3 MBit 


10 MBit 




GESAMT 


70000 Gatter + ca. 3.8 MBit 


10 MBit 



Insgesamt ergibt sich also fur den Bildspeicher ein Speicherbedarf von 3,3 MBit(Datenspeicher) + 0,5 MBit 
(Adrelispeicher) = ca. 3,8 MBit gegenuber 10 MBit fur das unkomprimierte Abspeichern der Bilder bei CCIR 
601, 4:2:0. 

Eventuell konnte bei einem Zeitmultiplexbetrieb von einzelnen Modulen (z.B. DCTs, Q's) bei Verwendung 
schneller Technologien der Hardwareaufwand noch reduziert werden. Dies ist jedoch vom einzelnen Anwen- 
dungsfall und von der Grenzfrequenz der Technologie gegenuber der zu verarbeitenden normabhangigen Da- 
tenmenge abhangig. 

Bei der Anwendung des beschriebenen Verfahrens zur Bewegungskompensation erhalt man im Normalfall 
ein Aufaddieren der durch diese Kompression entstandenen Fehler bis zum nachsten l-Bild. Falls dies nicht 
erwunscht ist, kann die Fehlerfortpflanzung auf die aufeinanderfolgenden B-Bilder mit folgendem Verfahren 
begrenzt werden: 

Zuerst wird ein I- oder P-Bild unkomprimiert in den Speicher geschrieben. Das danach einlaufende I- oder 
P-Bild wird, bedingt durch die maximale Lange des Bewegungsvektors, fur die ersten 64 Zeilen ebenfalls un- 
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komprimiert abgelegt und mit dem unkomprimierten I- / P-Bifd dekompensiert. Nun wird gleichzeitig damit be- 
gonnen, das l-Bild auszulesen, zu komprimieren und an anderer Stelle wieder in den Speicher zu schreiben. 

Die Kompression in dem erfindungsgemaften Verfahren kann auch ohne Transformation durchgefuhrt 
werden. Die Bilddaten konnen, ohne daB sie durch eine DCT / DCT~ 1 Oder andere Transformationen in den 

5 Frequenzbereich uberf uhrt wurden, mittels des Shannonschen Entropietheorems im Ortsbereich komprimiert 
werden. Hierzu wird zuerst eine optimale Huffmanntabelle der Daten im Ortsraum errechnet, wobei die Hau- 
figkeitsverteilung der Helligkeits- bzw. Chrominanzwerte im Ortsbereich genutzt wird. Die Huffmanntabelle 
wird dabei entweder on-line pro Bildausschnitt ermittelt Oder fest vorberechnet. Der Vorteil dieses Verfahrens 
liegt in einer geringeren Komplexitat der Kompression. Urn eine feste Ausgangsdatenrate zu garantieren, mud 

10 dieses Verfahren um eine geeignete Quantisierungsstufe erweitert werden. 



Patentanspruche 

15 1. Verfahren zur Codierung/Decodierung eines Datenstroms, umfassend die Verfahren sstuf en einer Umsor- 
tierung sowie einer Komprimierung bzw. Dekomprimierung der Daten, wobei die Daten zur Umsortierung 
in einem Zwischenspeicher abgelegt und in anderer Ordnung aus dem Zwischenspeicherausgelesen wer- 
den, dadurch gekennzeichnet, dali die Daten komprimiert in dem Zwischenspeicher abgelegt und beim 
Auslesen wieder dekomprimiert werden. 

20 

2. Verfahren nach Anspruch 1, wobei in der Stufe der Komprimierung bzw. Dekomprimierung Datenblocke 
aus dem Datenstrom in einem zweiten Zwischenspeicher abgelegt und wieder ausgelesen werden, da- 
durch gekennzeichnet, daft die Daten komprimiert in dem zweiten Zwischenspeicher abgelegt und beim 
Auslesen wieder dekomprimiert werden. 

25 

3. Verfahren nach Anspruch 1, gekennzeichnet durch ein Kompressionsverfahren, bei dem die Strukturen 
und GroRen einzelner Datengruppen, sowie der Ort derZwischenspeicherung unabhangig vom Datenin- 
halt def iniert und der Kompressionsfaktor einzelner Datengruppen festgelegt ist. 

30 4. Verfahren nach Anspruch 1 , 2 oder 3, dadurch gekennzeichnet, da& zur Kompression und Dekompression 
eine Differential-Puls-Code-Modulation (DPCM) verwendet wird. 

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daft die Differential-Puls-Code-Modulation 
(DPCM) mit blockweise arbeitenden zweidimensionalen Pradiktoren (13 und 17) durchgefuhrt wird. 

35 

6. Verfahren nach einem der Anspruche 4 und 5, dadurch gekennzeichnet, dali die Speicherplatze mittels 
hierarchisch strukturierter Adressierung zugeordnet werden. 

7. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dali die Daten einer zweidimensionalen diskreten 
40 Cosinustransformation (DCT) unterzogen, anschlie&end mittels einer Quantisierungsstufe (Q) und einer 

Huffmannkodlerung (VLC) komprimiert im Speicher abgelegt und beim Auslesen mittels der entsprechen- 
den inversen Operationen (VLD, Q~ 1 , DCT) wieder dekomprimiert werden. 

8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daft die Quantisierungsstufe (Q) durch eine 
45 pradiktiv arbeitende Quantisierungssteuerung (20) gesteuert wird. 

9. Verfahren nach Anspruch 1, 2 oder 4, dadurch gekennzeichnet, daft zur Kompression und Dekompression 
eine eindimensionale Transformationscodierung verwendet wird. 

50 



55 
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